نوشته شده توسط : مطلب پروژه

ارائه کلیه خدمات آماری (مشاوره و انجام تحلیل آماری پایان نامه ها و تحقیق ها) خصوصا در زمینه آنالیز واریانس (جدول آنوا) و طرح و تجزیه آزمایشها ویژه دانشجویان رشته های کشاورزی و یا سایر رشته ها، با استفاده از نرم افزار SAS (ساس) اعلام می کند. تحلیلگر ما در زمینه آنالیز آماری و تفسیر و تحلیل خروجی نرم افزار SAS ، فارغ التحصیل کارشناسی ارشد رشته آمار اقتصادی از دانشگاه دولتی هستند.
ضمنا ما دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیک وابسته به وزارت صنعت معدن و تجارت هستیم. توصیه پلیس این است که کالاها و خدمات از سایتهای دارای نماد اعتماد الکترونیک خریداری شود. همچنین سایت اصلی این شرکت طی قراردادی با بانک ملت ، داری درگاه پرداخت الکترونیک برای پرداخت آسان هزینه تحلیل با SAS می باشد.

ارتباط با ما :
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

می توانید با کپی و پیست کردن آدرس از صفحات فوق بازدید نمایید.

در خصوص نرم افزار SAS
نرم افزار SAS که مخفف عبارت Statistical Analysis System است، یکی از قدرتمندترین نرم افزارهای آماری است که دارای قابلیت های بسیاری در اکثر زمینه های آمار می باشد. سرعت پردازش اطلاعات در این نرم افزار به نحو قابل توجهی بالا است؛ این نرم افزار توانایی انجام انواع تحلیل های آماری شامل آمار توصیفی، انجام انواع آزمون های آماری پارامتری و ناپارامتری از جمله آزمون های بررسی نرمال بودن (کلموگروف-اسمیرنوف، شاپیرو و...) آزمون های دوجمله ای، آزمون دقیق فیشر، آزمون کای دو، آزمون نسبت درستنمایی، آزمون مقایسه میانگین ها و نسبت ها و ... را داراست.
همچنین با توجه به کاربرد آمار در رشته های مختلف، نرم افزار SAS زمینه تجزیه و تحلیل اطلاعات را به خوبی فراهم آورده است. از جمله این کاربردها می توان به آنالیز واریانس (آنوا)، تجزیه و تحلیل انواع سریهای زمانی(برازش الگوهای میانگین متحرک، اتورگرسیو، ARCH و سایر سری های زمانی)، ‌انواع رگرسیون خطی و غیرخطی، رگرسیون لجستیک، رگرسیون دو و چندمتغیره، تحلیل داده های بقا (داده های سانسور شده)، انواع طرح های تحلیل واریانس یکطرفه و چندطرفه (طرح های کرت خوردشده، مربع لاتین، طرح 2k و موارد دیگر)، تحلیل تشخیصی (تحلیل ممیزی)، آنالیز کواریانس و ... اشاره کرد.

SAS قطعا می تواند یکی از بهترین گزینه ها بخصوص برای دانشجویان رشته های اقتصاد، کشاورزی، پزشکی و... باشد..

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 237
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

آمادگی خویش را برای انجام تجزیه و تحلیل داده های با حجم بسیار بالا یا داده کاوی با نرم افزار معروف وکا (WEKA) اعلام می کند.سفارش انجام داده کاوی با سایر نرم افزارهای مربوط نیز پذیرفته می شود.
برای تماس با تحلیلگر داده کاوی این شرکت (سرکار خانم دهقان) با شماره زیر تماس بگیرید:
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

سایت اینترنتی ویژه این شرکت آماری:www.spss-iran.ir
قابل ذکر است ما دارای نماد اعتماد دائم الکترونیک در ارائه خدمات تحلیلی آماری بوده و به صورت تخصصی به موضوع تجزیه و تحلیلهای آماری می پردازیم. سایت مذکور دارای درگاه اینترنتی بانک ملت برای پرداخت آسان هزینه تحلیل می باشد.
هزینه تحلیل را نیز هنگامی به ما پرداخت نمایید که از تایید آن توسط استاد خود یا ناظر پروژه آماری مطمئن شدید!!

قابل ذکر است این شرکت آماده انجام خدمات تجزیه و تحلیل آماری پایان نامه ها و مقالات، آزمون های اقتصاد سنجی و همچنین مدل سازی معادلات ساختاری با نرم افزار های آماری مانند spss، sas، eviews، R، lisrel، Amos، smart pls، expert choice و مانند آن می باشیم.

درباره داده کاوی یا DATA MINING:
امروزه لحظه به لحظه به حجم داده ها در پایگاه داده ها اضافه شده و انبارهای ( توده های ) عظیمی از داده ها ایجاد شده است ، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده و داده کاوی را به مهم ترین فناوری برای بهره وری موثر ، صحیح و سریع ازداده های حجیم تبدیل نموده است که اهمیت آن رو به فزونی است.09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین داده ، . . . می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
کاربردهای عمومی داده کاوی بیشتر شامل تقسیم کردن داده ها در خوشه های مقتضی، کدگذاریهای مناسب، کاوش برای الگوها و طراحی کردن با استفاده از فنون آماری و الگوریتمهای ژنتیکی است.

نرم افزارهای انجام داده کاوی:

نرم افزارهای آماری عمومی مثل SPSS, SAS, STATISTICA با امکاناتی برای داده کاوی و بسته های نرم افزاری اختصاصی داده کاوی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 297
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

هدف از تشکیل کلاس آموزشی Clementine 12، آموزش و ارائه تجربیات مدرسین این گروه در یک دوره کوتاه مدت و فشره به علاقمندان و شرکت کنندگان در این دوره می باشد. عزیزان شرکت کننده پس از طی این دوره قادر خواهند بود، در جهت پیاده سازی فرآیند داده کاوی بصورت نرم افزاری، در حل مسائل از دانش داده کاوی خود استفاده نمایند.

مخاطبان این دوره دانشجویان مقاطع مختلف رشته های مهندسی و علوم کامپیوتر، آمار، مهندسی صنایع، مدیریت و سایر رشته های مرتبط می باشند. همچنین محققان و کارشناسان شرکت ها و سازمانهای دولتی و خصوصی که به نوعی با تجزیه و تحلیل داده های انبوه سروکار دارند نیز از مخاطبان اصلی این کلاس هستند.

محتوای دوره

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


- آشنایی با محیط Clementine 12 و قابلیت های آن

- پشتیبانی Clementine 12 از استاندارد CRISP-DM

- ورود داده ها با فرمت های مختلف به محیط کاری Clementine 12

- چگونگی ایجاد درک اولیه از داده ها و آماده سازی آن

o استفاده از آمار توصیفی و گرافهای متنوع

o چگونگی تشخیص و برخورد با داده های گمشده و پرت

- مدلسازی

o طبقه بندی

 

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

o پیش بینی



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 233
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

-تحلیل پروژه های داده کاویData Mining با استفاده از نرم افزار Weka ، Clementine ، Rapid Miner و SAS Enterprise Miner

2-آموزش مقاله نویسی در سطح انواع ژورنالها ی ISI و غیر ISI و کنفرانس های بین المللی داخلی و خارجی و IEEE.
در طی برگزاری این جلسه آموزشی شما توانایی استخراج مقاله از پایان نامه خود را نیز در تمام سطوح پیدا می کنید.
در این جلسه به شما آموزش داده می شودکه چگونه بیش از یک مقاله از پایان نامه خود استخراج نمایید.

و همچنین مکان و نحوه ارسال مقاله واینکه چه نکاتی را باید در متن مقاله لحاظ کنید تا مقاله شما مورد پذیرش واقع شود را فرا خواهید گرفت.azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 

نحوه ارائه شفاهی مقالات در کنفرانس های داخلی و خارجی و نکاتی را که باید لحاظ کنید را فرا خواهید گرفت.
آیا می دانستید که برای ارائه مقالات بین المللی و به زبان انگلیسی شما نیازی به تسلط داشتن به زبان انگلیسی ندارید!!!
و اینکه چگونه می توانید بفهمید که مقاله ای را که آماده کرده اید در چه سطی قابلیت پذیرفته شدن را دارد.
و هزاران نکته ی دیگر .....
تیم تحقیقاتی سهند تا کنون بیش از 50 مقاله علمی در سطوح بین المللی به چاپ رسانده است که شما می توانید از تجربیات صادقانه این تیم بهره گیرید.
ضمنا استخراج مقاله از پایان نامه خود را می توانید به دست متخصصان تیم سهند بسپارید.

3- انجام مشاوره و اجرای پروژه های مدیریت دانش (Knowledge Management)و
مدیریت منابع انسانی(Human Resource Management)
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

4- تحلیل پروژه های داده کاویData Mining با استفاده از نرم افزار Weka ، Clementine ، Rapid Miner و SAS Enterprise Miner

5- تدوین مدل های رتبه بندی با استفاده از تکنیک های تصمیم گیری چند معیاره MCDMاز قبیل AHP، TOPSIS، SAW، ELECTRE ، Group TOPSIS، FUZZY AHP، FUZZY TOPSIS

6- طراحی سیستمهای استنتاج فازی ومنطق فازی Fuzzy Logic، شبکه های عصبی-فازی ANFISو نرم افزار FIS MATLAB سیستم های خبره فازی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

7- تجزیه و تحلیل آماری پایان نامه، تحقیقات میدانی و پرسشنامه ای با استفاده از نرم افزار SPSS و Lisrel

8- بررسی و تحلیل کارایی و بهره وری از طریق تحلیل پوششی داده ها DEA با استفاده از نرم افزار EMS و WinDEAP

9- طراحی سیستمهای خبره Expert Systems تحت shell با استفاده از نرم افزارهای VP-expert و Clips

10- مدل سازی بوسیله شبکه های عصبی مصنوعی ANN و الگوریتم ژنتیک GA

11- انجام پروژه های کنترل کیفیت و مباحث مرتبط با ISO.

12- مدیریت ارتباط با مشتری (CRM) و نرم افزار Sugar CRM .

13-آموزش نرم افزار های تخصصی ذیل:
SPSS , Rapid Miner, SAS Interprise Miner ، Weka , Clementine، FIS MATLAB ،ANFIS
، VP-expert , Lingo, DS, Sugar CRM.

14- طراحی سیستم پشتیبان تصمیم (Decision Support System(DSS))

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

ارائه مشاوره در خصوص فصول پایان نامه جهت تکمیل تحقیق و آگاهی از چگونگی تحلیل داده ها و نتایج حاصله برای ارائه کار به استاد راهنما و راهنمایی برای آمادگی در جلسه دفاع پایان نامه و راهنمایی و کمک جهت تسریع در اتمام پایان نامه و تجزیه تحلیل داده های پایان نامه.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

قیمت: توافقی با توجه به حجم کار
آدرس: در سراسر کشور می توانید از خدمات ما بهره مند شوید.



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 275
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

چکیده

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 جانواران یا حیوانات یکی از  انواع مهم جانداران هستند که از زیر گرو های مختلفی تقسیم شده اند .هدف از این تحقیق طبقه بندی حیوانات می باشد . با انتخاب نوع حیوان (دسته) به عنوان متغیر هدف و 17 متغیر پیشگو از انواع مختلف مشاهده گردید که  متغیر های  چون  پستاندار , دارای ستون فقرات ،دارای بال،  قابلیت پرواز،  دارای فلس ،آبزی ، تغذیه کننده شکار  و تعداد پاها به عنوان متغیر های  مهم شناخته شده اند که با این ویژگی ها میتوان نوع دسته حیوانات را تشخیص داد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 196
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در پزشکی : سوتغذیه

 

چکیده

سوءتغذیه نوعی بیماری  به‌شمار می‌آید که به علت مصرف ناکافی یا بیش از اندازهً یک یا چند ماده غذایی بروز می‌کند.هدف از این تحقیق عوامل موثر در بروز سوء تغذیه می باشد . یافته های تحقیق حاکی از آن است که عواملی چون بی ام ای ، فقر آهن و سن در آن نقش دارند .

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 200
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در بیماری تیروئید

 

چکیده

تیروئید یک غده  شبیه بال پروانه است که  جلوی گردن قرار گرفته است. تیروئید افراد سالم به میزان کافی هورمون می سازد و در اعمال مهم  بدن اثر می گذارد. این هورمونها  سوخت و ساز بدن را از جمله آنکه چه مقدار کالری مصرف کنیم، چه مقدار احساس گرما کنیم و وزن  ما را تنظیم می‌کنند، در بعضی  اعضاء  نیز اثرات اختصاصی دارد مانند قلب که در اثر این هورمونها تندتر می‌زند. پر کاری  تیروئید حالتی است که  باعث می شود مقدار زیادی  هورمون به بافتهای بدن برسد. علل متفاوتی برای پر کاری تیروئید وجود دارد اما علائم  و نشانه های آن مشابه است. به علت افزایش سوخت و ساز بدن بیماران احساس گرمای بیشتری می کنند و اغلب با وجود مصرف غذای زیاد کاهش وزن دارند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 222
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

جهت وفاداری مشتری RFMطراحی یک متدلوژی مبتنی بر

 

چکیده
داده کاوی یکی از تکنیک های جدید برای کاوش الگو ها با توجه به داده های مشتریان است که سبب بهبود ارتباط با مشتری می شود و از ابزار ها مطرح در مدیریت ارتباط با مشتری می باشند. موضوع به این دلیل اهمیت دارد که سازمانها برای موفقیت در کسب و کار لازم دارند مشتریانشان را به درستی بشناسند و نیاز ها و خواسته های آنها را پیش بینی کنند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 161
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در بیماری افسردگی

 

چکیده
هدف از این تحقیق شناسایی عوامل موثر در تشخیص بیماری افسردگی میباشد.داده ها مربوط به بیمارانی با درصد افسردگی کم ،متوسط و زیاد میباشد. عوامل متعددی در تشدید بیماری افسردگی دخیل هستند در این تحقیق مهمترین عوامل عبارتند از عدم فعالیتهای ورزشی ، ایمان و اعتقادات دینی پایین،مجرد بودن،داشتن دوست از جنس مخالف موسیقی زیادو

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 392
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در پیش بینی تصادفات

 

چکیده
هدف این تحقیق بررسی و شناخت عوامل موثر در بروز تصادفات رانندگی می باشد . ابتدا با بررسی منابع مشخص گردید که در بروز تصادفات جاده ای عوامل گوناگونی مانند انسان ، جاده و وسیله نقلیه دخالت دارند که از این بین نقش عوامل انسانی و وسیله نقلیه بیش از سایر عوامل میباشد .یافته های تحقیق حاکی از آن است که از بین عوامل موثر در تصادفات عوامل انسانی بیشترین نقش را ایفا می کند . عوامل انسانی چون بی توجهی به قوانین ، خستگی ، عجله سرعت غیر مجاز بیشترین نقش را ایفا می کند . وسیله نقلیه نیز در جایگاه دوم قرار دارد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 283
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در بازاریابی بانکی

 

چکیده
بازاریابی مستقیم بانکی، نوعی بازاریابی است که مستقیماً با مشتری ارتباط برقرار می‌شود. در این روش، افرادی که بازاریابی می‌شوند مستقیماً ازبازار هدف انتخاب می‌شوند. بازاریابی مستقیم نوعی تاکتیک تهاجمی در بازاریابی است که معمولاً با استفاده از ابزارارتباطی مستقیم برای رسیدن به مشتریان جدید تلاش می کند . بازاریابی مستقیم می تواند در مورد مشتریان فعلی یا گذشته هم اجرا شود

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 209
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در تحلیل سبد بازار

 

چکیده
یکی از حالت های تحلیل قواعد تلازمی ، تجزیه و تحلیل سبد بازار میباشد.پیشرفت فناوری فروشگاه ها را قادر می سازد تا حجم زیادی از داده های خرید مشتریان را جمع آوری و ذخیره نمایند .هر مشتری خرید مجزایی را در مقادیر مختلف و زمانهای متفاوت انجام می دهد و داده های موجود در سبد بازار نشان دهنده خرید مشتری در یک زمان خاص است . با تجزیه و تحلیل سبد بازار خرده فروشان می توانند رفتار مشتریان را پیش بینی کنند. این کار به آنها کمک می کند تا بتوانند کالای های خود را بهتر سازماندهی کرده و چیدمان بهتری از محصولات خود داشته باشند و از این طریق سودآوری خود را افزایش دهند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 417
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در مخابرات

 

چکیده
یکی ار کاربرد های داده کاوی در زمینه مخابرات است .در این تحقیق یک شرکت مخابرات می خواهد مشتریانش را بر اساس الگو های مصرف خدمات بخش بندی کند و آنها را به چهار گروه دسته بندی کند تا بداند یک مشتری از چه نوع خدمات استفاده می کند تا پیشنهادات آتی به هر مشتری را سفارشی سازی کند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 283
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در بیماری سرطان

 

چکیده
هدف این تحقیق بررسی و شناخت عوامل موثر بر بیماری سرطان از نوع خوش خیم و بدخیم می باشد . ابتدا با بررسی منابع مشخص گردید که در بروز بیماری سرطان از نوع خوش خیم و بدخیم عوامل گوناگونی مانند یکنواختی اندازه سلول ، ضخامت و انبوه تومور، کروماتین ملایم و هستک طبیعی نقش زیادی دارند که از این بین نقش یکنواختی اندازه سلول و ضخامت انبوه تومور بیش از سایر عوامل میباشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 298
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در مدیریت بیمه

 

چکیده
با توجه به پیشرفت سریع فناوری اطلاعات حجم اطلاعات ذخیره شده در پایگاه های داده شرکت های بیمه به سرعت در حال افزایش است .در این تحقیق ضمن بررسی اجمالی داده کاوی به نقش آن در کشف دانش موجود در پایگاه های داده و بهبود امور مرتبط با صنعت بیمه می پردازد بیشتر هدف در این تحقیق این است که بدانیم چه قرار دادهایی برای بیمه سود آور و چه نوع قرار داده هایی برای بیمه غیر سود آور(زیان آور ) می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 202
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در مدیریت بانکداری

 

چکیده
یکی از مسائلی که برای بانک ها بسار مهم می باشد این است که قبل از اعطای تسهیلات ، احتمال عدم بازپرداخت از سوی مشتریان را ارزیابی کند .در این نوع مسائل که در آن پیش بینی کلاس مشتریان بر مبنای مشخصات آنها از جمله اطلاعات شخصی ، اطلاعات اعتباری ، سوابق تسهیلات بانکی ، اطلاعات قضایی و غیره انجام می گیرد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 299
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

کاربرد داده کاوی در عود مجدد سرطان پستان

 

چکیده
امروزه در دانش پزشکی شاهد جمع آوری داده های فراوان در مورد بیماری های مختلف هستیم .تحقیق روی این داده ها و بدست آوردن نتایج و الگو های مفید در رابطه با بیماری ها یکی از اهداف استفاده از این داده ها است. سرطان پستان یکی از شایع ترین انواع سرطان ها در زنان است. طبق محاسبات انستیتو ملی سرطان ایالات متحده آمریکا، از هر هشت زن یک نفر در زندگی خود مبتلا به سرطان پستان می‌شود این سرطان در صورتی که به موقع تشخیص داده‌شود به راحتی قابل درمان است

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 309
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

چکیده

امروزه در دانش پزشکی شاهد جمع آوری داده های فراوان در مورد بیماری های مختلف هستیم.تحقیق روی این داده ها و بدست آوردن نتایج و الگو های مفید در رابطه با بیماری ها یکی از اهداف استفاده از این داده ها است.در این پروژه برای بدست آوردن روابط مفید بین عوامل خطر زا در بیماری قلبی استفاده کرده ایم.این بیماری با توجه به شیوه و سهمی که در مرگ و میر انسانها دارند از اهمیت بالایی برخوردار ند.با اعمال داده کاوی روی این داده ها مهمترین متغیرها در ارتباط با آنژین صدری ناشی از ورزش، نوع درد سینه ،قند خون ، سن ، حداکثر ضربان قلب و فشار خون است


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 359
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

انجام پایان نامه و پروژه های ارشد داده کاوی

 انجام پایان نامه  ارشد داده کاوی

الگوریتم های دسته بندیClassification

درخت تصمیم :C5.0 ، CHAID ، C&R ،QUEST

شبکه عصبی :Neural Net

شبکه بیزین : Bayes Net

ماشین بردار پشتیبان : SVM

رگرسیون : Regression ، Logeistic

الگوریتم های خوشه بندی Clustering

خوشه بندی : k-Means ، kohonen  ، Twostep ، Anomaly

الگوریتم های قواعد انجمنی : Apriori ، Carma ، Sequence



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 197
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

انجام پروژه های داده کاوی با نرم افزار
weka
clementine12
spss modeler14.2
rapidminer
در کوتاه ترین زمان و با قیمت مناسب

بیش از دهها پروژه اماده با نرم افزار های داده کاوی در زمینه های مختلف با قیمت مناسب برای دانشجویان کارشناسی و کارشناسی ارشد و دکتری

----------------------------------------

ساعات تماس 8 صبح الی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 223
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

مروری بر ادبیات داده کاوی

!داده کاوی چیست

انگیزه کاوش داده ها در چیست

کاربرد داده کاوی در چیست

و قابلیت های آن(SPSS Modeler14.2) آشنایی با محیط کلمنتاین

( SPSS Modeler14.2) ورود داده ها با فرمت های مختلف به محیط کاری کلمنتاین

چگونگی ایجاد درک اولیه از داده ها و آماده سازی آن ، پیش پردازش داده ها

استفاده از آمارهای توصیفی و گرافهای متنوع

چگونگی تشخیص و برخورد با داده های گمشده

خوشه بندی

قواعد تلازمی

...دسته بندی و پیش بینی - درخت تصمیم ، شبکه های عصبی

تحلیل و تفسیر داده ها

. . . و

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 227
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

آموزش نرم افزار کلمنتاین Clementine 12

آموزش  نرم افزار14 IBM SPSS Modeler

انجام پروژه های داده کاوی با نرم افزارClementine 12

انجام پروژه های داده کاوی با نرم افزار 14 IBM SPSS Modeler

    • فرآیند داده کاوی CRISP-DM
    • آشنایی با قابلیت های SPSS Modeler14.2
    • فرآیند داده کاوی در SPSS Modeler14.2
  • شناسایی و آماده سازی مقدماتی داده ها
    • فراخوانی داده ها در محیط SPSS Modeler14.2
    • بررسی مفاهیم Storage و Type و اهمیت آنها
    • یکپارچه سازی داده ها (Merge and Append)
    • بررسی شاخص های کیفی داده ها (Data Audit)
    • مطالعه توصیفی و استنباطی داده ها در SPSS Modeler14.2
  • مدل های پیش بینی کننده
    • طبقه بندی با انواع درخت های تصمیم در SPSS Modeler14.2
    • استفاده از درخت های رگرسیونی به منظور پیش بینی
    • ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
    • ارزیابی مقدماتی مدلهای پیش بینی کننده


:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 742
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

مشاوره در زمینه پروژه های داده کاوی

در مقاطع کارشناسی و کارشناسی ارشد

با نرم افزار weka- clementine 12

از ابتدا تا انتها



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 249
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

پروژه آماده داده کاوی با نرم افزار weka - clementine 12

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 537
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

انباره داده ها

سازمانها درک کرده اند که سیستم های انبارداده ابزارهای ارزشمندی در رقابتهای امروزه هستند بنگاهای بسیاری میلونها دلار برای ساخت انبار داده صرف کرده اند طبق تعریف اینمون یکی از پیشتازان معماری در ساخت سیستمهای انبار داده ، انبار داده مجموعه ای موضوع گرا ،یکپارچه از زمانهای مختلف و غیر فرار به منظور پشتیانی از فرایند تصمیم سازی است.داده کاوی چیزی فراتر از پردازش بر روی یک پایگاه داده معمولی می باشد .


مثالهای زیر این تفاوت را آشکار می کند :
یک پرس جوی ساده و پیدا کردن تمامی افراد با نام علی در یک پایگاه داده بسیار ساده ولی در مقابل پیدا کردن افرادی که کارت اعتباری انها وضعیت مناسبی ندارد و در مرز ورشکستگی می باشد، خیلی ساده نیست .پیدا کردن افرادی که بیش از یکصد هزار تومان خرید داشته اند ساده است ولی در مقابل پیدا کردن افرادی که عادتهای خرید مشاهی دارند و یکسری اقلام خاصی را با هم خرید می کنند کار ساده ای نیست .

پیدا کردن افرادی که در یک تاریخ خاص از یک فروشگاه خاص شیر خریده اند ساده است

ولی در مقابل افرادی که غالبا شیر خریداری می کنند خیلی ساده نیست


داده کاوی و انبار داده ها :


علت اهمیت انبار داده ها این است که انباره داده ها شامل داده های جزئی و داده های کلی ، در کنار یکدیگر می باشند . بدون تردید داده کاوی به اطلاعات جزئی برای تحلیل نیازمند است ، اما داده ای خلاصه شده نیز به کار می آیند . از انجا که در انبار داده انواع داده ای خلاصه شده وجود دارد ، داده کاوی می تواند .به سرعت داده ای انبارداده انواع داده ای خلاصه شده وجود دارد ف داده کاوی می تواند به سرعت داده ای انبارداده را بررسی و این باعث کاهش تکرار تحلیلها توسط داده کاوی شود


  ویزگیهای مهم یک انبار داده عبارتند از موضوع محوری :
جامعیت
پویا پذیری
پایانی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

موضوع محوری : داده ها طبق یک موضوع خاص سازماندهی می شوند


جامعیت :داده ای انباره ،از تجمع دیگر داده ها ساخته می شوند


افق زمانی برای انبارداده ها بسیار مهم تر از داده های مرتبط با سیستم های عملیاتی می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

پایگاه داده ها شامل داده های است که روزانه با انها کار می شود و بخشهای به آن اضافه و یا حذف می شود



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 277
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

قواعد تلازمی

استخراج قواعد تلازمی یا قواهد انجمنی نوعی عملیات داده کاوی است که به جستجو برای یافتن ارتباط بین ویژ گیها در مجموعه دادها می پردازد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

نام دیگر روش تحلیل تلازمی ، تحلیل سبد بازار می باشد . به عبارت دیگر تحلیل تلازمی مطلالعه ویژگیها یا خصوصیاتی میباشد که با یکدیگر همراه بوده و به دنبال استخراج قواعد از میان این خصوصیات میباشد

این روش به دنبال استخراج قواعد به منظور کمی کردن ارتباط میان دو یا چند خصوصیت است .قواعد تلازمی به شکل اگر و انگاه به همراه دو معیار پشتیبان و اطمینان تعریف می شود


همان طور که اشاره شد ، یکی از کاربردی ترین حالت های تحلیل قواعد تلازمی ، تجزیه و تحلیل سبد بازار است . پیشرفت فناوری ، فروشگاه های خرده فروشی را قادر ساخته است تا حجم زیادی از داده های خرید مشتریان که از ان به عنوان سبد بازار یاد میشود را جمع اوری و ذخیره نماید . هر مشتری خرید مجزایی را در مقادیر مختلف و زمانهای متفاوت انجام میدهد و داده های موجود در سبد بازار ،نشان دهنده خرید مشتری در یک زمان خاص است .با تجزیه و تحلیل سبد بازار خرده فروشان می توانند رفتار خرید مشتریان را پیش بینی کنند . این کار به انها کمک می کند تا بتوانند کالاهای خود را بهتر سازماندهی کرده .و چیدمان بهتری از محصولات خود داشته باشند و از این طریق سود آوری خود را افزایش دهند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

در اینجا به مثالهایی از کاربرد قواعد تلازمی اشاره میشود :


بررسی ارتباط بین توانایی خواندن کودکان با خواندن داستان توسط والدین برای آنها بررسی اینکه چه اقلامی در یک فروشگاه با یکدیکر خریداری میشوند و اینکه چه اقلامی هیچ گاه با یکدیگر خریداری نمی شوند تعیین نمونه ها در بررسی تاثیرات خطر ناک یک داروی جدید



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 951
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

الگوریتم درخت تصمیم

ساختار درخت تصمیم یک ساختار درختی ، شبیه فلوچارت میباشد


بالاترین گره در درخت گره ریشه است و گره های برگ ،دسته ها یا توزیع دسته ها را نشان می دهند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

درخت تصمیم یکی از ابزار های قوی و متداول برای دسته بندی و پیش بینی می باشد.در خت تصمیم بر خلاف شبکه های عصبی به تولید قاعده می پردازد.در ساختار درخت تصمیم ف پیش بینی به دست امده از درخت در قالب یگسری قواعد توضیح داده می شود . در حالی که در شبکه های عصبی تنها نتیجه پیش بینی بیان میشود و چگونگی به دست امدن انها در خود شبکه پنهان می ماند. همچنین در درخت تصمیم برخلاف شبکه های عصبی ضرورتی وجود ندارد که داده ها لزوما به صورت عددی باشند
:خصوصیات درخت تصمیم به موارد زیر می تواند اشاره کند :

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

روش درخت تصمیم در تقسیم بندی داده ها به گرو ه های مختلف به گونه ای است که هیچ داده ای حذف نمی شود ، تعداد داده ها در گروه مادر با مجموع داده ها در شاخه های در خت ایجاد شده برابر است


استفاده از درخت تصمیم اسان است


درک مدل ایجاد شده توسط درخت تصمیم اسان است


دسته بندی هایی که توسط درخت تصمیم ایجد می شوند ، از روی شباهت داده های ذخیره شده در پارامتر های پیش بینی کننده ، قابل انجام می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

انواع متغیر های موجود در داده های در خت تصمیم :

 

در مسائل مرتبط با درختهای تصمیم با دو نوع متغیر ها مواجه هستیم :

متغیر های عددی مثل مشخصه "سن که مقادیر ان عددی است


متغیر های طبقه ای مثل مشخصه نوع ماشین که مقادیر آن متنی و گروهی میباشد


از این متغیر ها برای پیش بینی متغیر هدف یا متغیر وابسته استفاده می کنیم در مثال فوق به متغیر های سن و نوع ماشین که متغیر های مستقل هستند ، متغیر پیش بینی کننده گویند و به متغیر های وابسته برچسب دسته گویند . در مثال بالا متغیر ریسک تصادف از نوع برچسب دسته می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

اگر متغیر وابسته از نوع عددی باشد مسئله رگرسیون یا پیش بینی تبدیل خواهد شد و اگر این متغیر از نوع طبقه ای باشد با یک مسئله دسته بندی مواجه هستیم



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 571
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

خوشه بندی یکی از شاخه های یادگیری بدون نظارت می باشد و فرآیند خودکاری است که در طی آن، نمونه ها به دسته هایی که اعضای آن مشابه یکدیگر می با­شند تقسیم می شوند که به این دسته ها خوشه گفته می­شود. بنابراین خوشه مجموعه ای از اشیاء می باشد که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشه های دیگر غیر مشابه می باشند

برای مشابه بودن می توان معیارهای مختلفی را در نظر گرفت مثلا می توان معیار فاصله را برای خوشه بندی مورد استفاده قرار داد و اشیائی را که به یکدیگر نزدیکتر هستند را بعنوان یک خوشه در نظر گرفت که به این نوع خوشه بندی، خوشه بندی مبتنی بر فاصله نیز گفته می شود

خوشه­ بندی به عمل تقسیم جمعیت ناهمگن به تعدادی از زیر مجموعه­ ها یا خوشه ­های همگن گفته می­شود. وجه تمایز خوشه­بندی از دسته­بندی این است که خوشه بندی به دسته ­های از پیش تعیین شده تکیه ندارد. در دسته­ بندی بر اساس یک مدل هر کدام از داده­ها به دسته­ای از پیش تعیین شده اختصاص می­یابد؛ این دسته­ ها یا از ابتدا در طبیعت وجود داشته­اند(مثل جنسیت، رنگ پوست و مثال­هایی از این قبیل) یا از طریق یافته­های پژوهش­های پیشین تعیین گردیده ­اند

در خوشه­ بندی هیچ دستۀ از پیش تعیین شده ­ای وجود ندارد و داده ­ها صرفاً براساس تشابه گروه ­بندی می­شوند و عناوین هر گروه نیز توسط کاربر تعیین می­گردد. به طور مثال خوشه­ های علائم بیماری­ها ممکن است بیماری­های مختلفی را نشان دهند و خوشه­ های ویژگی­های مشتریان ممکن است حاکی از بخش­های مختلف بازار باشد
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

خوشه ­بندی معمولاً به عنوان پیش درآمدی برای بکارگیری سایر تحلیل ­های داده­کاوی یا مدل­سازی به کار می­رود. به عنوان مثال، خوشه­ بندی ممکن است اولین گام در تلاش برای تقسیم­ بندی بازار باشد؛ برای ایجاد یک قانون که در همۀ موارد کاربرد داشته باشد و به این سؤال پاسخ دهد که مشتریان به چه نوع تبلیغاتی به بهترین نحو پاسخ می­دهند اول باید مشتریان را به خوشه­ های متشکل از افرادی با عادات مشابه خرید تقسیم نمود و سپس پرسید که چه نوع تبلیغاتی برای هر خوشه به بهترین نحو عمل می­ کند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 296
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

دسته بندی چیست ؟

دسته بندی و پیش بینی دو نوع عملیات برای تحلیل داده ها و استخراج مدل به منظور توصیف دسته های مهم داده ها ، فهم و پیش بینی رفتار آینده آنها میباشد . مدلهای دسته بندی در تحلیل داده های گسسته و طبقه ای بکار رفته و مدلهای پیش بینی یا رگرسیون بیشتر بر روی داده های پیوسته بکار می رود

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

به عنوام مثال یک مدل دسته بندی ممکن است برای دسته بندی کردن وامهای بانک به دو طبقه وامهای بی خطر و پر خطر به کار رود در حالی که مدلهای پیش بینی به کار گرفته شده در این کسب و کار خاص سعی در پیش بینی میزان مخارج و هزینه های مشتریان بر اساس ویزگیهای در آمدی و شغلی آنها دارند


دسته بندی ، هر جزء از داده ها را بر مبنای اختلاف بین داده ها به مجموعه های از پیش تعریف شده دسته ها تصویر می کند . باید بگوییم دسته بندی یادگیری با نظارت میباشد که دسته ها از قبل مشخص میباشند


دسته بندی داده ها ، فرایند دو مرحله ای میباشد . اولین مرحله ساخت مدل و دومین مرحله استفاده از مدل و پیش بینی از طریق داده های قبلی میباشد


مرحله اول ساخت مدل: عبارتست از توصیف یک سری از دسته های از پیش تعین شده بر مبنای مجموعه داده های آموزش مدل که البته این فرآیند ، یادگیری نیز نامیده می شود در این فرآیند سعی می شود با توجه به نمونه های موجود ف مدلی ساخته شود که بر اساس آن بتوان داده ای فاقد برچسب دسته را در دسته های مربوط به خودشان قرار داد


مرحله دوم استفاده از مدل : این مرحله دارای دو بخش میباشد . در بخش نخست مدل ساخته شده مورد آزمون واقع می شود تا دقت پیش بینی آن بررسی شود . در بخش دوم نیز مدلی که دارای دقت مناسبی است ، برای دسته بندی داده ها به کار گرفته میشود . به منظور تخمین دقت پیش بینی مدل مجموعه ای از داده ها ی آزمایشی به طور اتفاقی از میان داده ها انتخاب میشوند و مدل روی آنها اجرا میشود . هدف اصلی در اینجا بالاتر بودن تخمین دقت مدل می باشد تا به هنگام استفاده هر داده را به دسته مناسب ان تخصیص دهد


روشهای مختلف دسته بندی :

روشهای زیادی برای دسته بندی وجود دارد که از جمله می توان به موارد زیر اشاره کرد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بیز ساده و شبکه های بیزی
نزدیک ترین همسایگی
شبکه های عصبی
درخت تصمیم
رگرسیون

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 521
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

داده کاوی چیست؟

استخراج اطلاعات و دانش و کشف الگو های پنهان از پایگاه داده های بسیار بزرگ میباشد


انگیزه کاوش داده ها ؟
انگیزه تجاری
انگیزه علمی

  داده هایی با ماهیت تجاری :


داده های وب و داده های تجارت الکترونیک
خرید و فروش های موجود در فروشگاه های خواربار فروشی و زنجیره ای
تراکنش های بانکی و کارت های اعتباری


پس داده های تجاری را با اهداف تجاری مورد پردازش قرار می دهیم و در نهایت از نتایج این پردازش برای دستیابی به سود بیشتر استفاده می کنیم

داده های با ماهیت علمی:


تصاویر ارسالی از طریق ماهواره
تصاویر ارسالی تاسکوپ ها
شبیه سازی علمی
داده های ژنی


وقتی داده ها از نوع علمی باشد معمولا کاوش داده ای علمی به سود بیشتر منجر نمی شود اما بیشتر اوقات با ایجاد دستاورد جدید و یا خدمت رسانی بیشتر به افراد و یا کشف حقایق خواهد شد

  کاربرد های داده کاوی :


مدیریت بانکداری
بیمه
پزشکی
بازار یابی

مدیریت ارتباط با مشتری

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بورس سهام
زمین شناسی و زلزله
سیاسی
هواشناسی
و غیره

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 366
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()
نوشته شده توسط : مطلب پروژه

مقدمه

  تا به امروز نرم افزارهای تجاری و آموزشی فراوانی برای داده کاوی در حوزه های مختلف داده ها به دنیای علم و فناوری عرضه شده اند. هریک از آنها با توجه به نوع اصلی داده هایی که مورد کاوش قرار میدهند، روی الگوریتمهای خاصی متمرکز شده اند. مقایسه دقیق و علمی این ابزارها باید از جنبه های متفاوت و متعددی مانند تنوع انواع و فرمت داده های ورودی، حجم ممکن برای پردازش داده ها، الگـوریتمهای پیاده سـازی شده، روشهای ارزیابی نتایج، روشهای مصـور سـازی، روشهای پیش پردازش داده ها، واسطهای کاربر پسند، پلت‌فرمهای سازگار برای اجرا،قیمت و در دسترس بودن نرم افزار صورت گیرد. از آن میان، نرم افزار Weka با داشتن امکانات بسیار گسترده،امکان مقایسه خروجی روشهای مختلف با هم، راهنمای خوب، واسط گرافیگی کارا، سازگاری با سایر برنامه های ویندوزی، و از همه مهمتر وجود کتابی بسیار جامع و مرتبط با آن [Data Mining, witten et Al. 2005 ] ، معرفی میشود.

 

1- معرفی نرم افزار Weka

میزکارWeka ، مجموع‌های از الگوریتمهای روز یادگیری ماشینی و ابزارهای پیش پردازش داده‌ها میباشد. این نرم‌افزار به گونه‌ای طراحی شده است که میتوان به سرعت، روشهای موجود را به صورت انعطافپذیری روی مجموعه‌های جدید داده، آزمایش نمود. این نرم‌افزار، پشتیبانی‌های ارزشمندی را برای کل فرآیند داده کاوی های تجربی فراهم میکند. این پشتیبانی‌ها، آماده سازی داده‌های ورودی، ارزیابی آماری چارچوبهای یادگیری و نمایش گرافیکی داده‌های ورودی و نتایج یادگیری را در بر میگیرند. همچنین، هماهنگ با دامنه وسیع الگوریتمهای یادگیری، این نرم‌افزار شامل ابزارهای متنوع پیش پردازش داده‌هاست. این جعبه ابزار متنوع و جامع، از طریق یک واسط متداول در دسترس است، به نحوی که کاربر میتواند روشهای متفاوت را در آن با یکدیگر مقایسه کند و روشهایی را که برای مسایل مدنظر مناسبتر هستند، تشخیص دهد.

نرم‌افزار Weka در دانشگاه Waikato واقع در نیوزلند توسعه یافته است و اسم آن از عبارت"Waikato Environment for knowledge Analysis" استخراج گشته است. همچنین Weka ، نام پرندهای با طبیعت جستجوگر است که پرواز نمیکند و در نیوزلند، یافت میشود. (شکل زیر)

این سیستم به زبان جاوا نوشته شده و بر اساس لیسانس عمومی و فراگیر GNU انتشار یافته است.Weka تقریباً روی هر پلت فرمی اجرا میشود و نیز تحت سیستم عاملهای لینوکس، ویندوز، و مکینتاش، و حتی روی یک منشی دیجیتالی شخصی، آزمایش شده است.

این نرم افزار، یک واسط همگون برای بسیاری از الگوریتمهای یادگیری متفاوت، فراهم کرده است که از طریق آن روشهای پیش پردازش، پس از پردازش و ارزیابی نتایج طرح های یادگیری روی همه مجموعه های داده موجود، قابل اعمال است.

نرم افزار Weka ، پیاده سازی الگوریتمهای مختلف یادگیری را فراهم میکند و به آسانی میتوان آنها را به مجموعه های داده خود اعمال کرد.

  همچنین، این نرم افزار شامل مجموعه متنوعی از ابزارهای تبدیل مجموعه‌های داده ها، همانند الگوریتمهای گسسته سازی میباشد. در این محیط میتوان یک مجموعه داده را پیش پردازش کرد، آن را به یک طرح یادگیری وارد نمود، و دسته‌بندی حاصله و کارآیی‌اش را مورد تحلیل قرار داد.( همه این کارها، بدون نیاز به نوشتن هیچ قطعه برنامه‌ای میسر است.)

  این محیط، شامل روشهایی برای همه مسایل استاندارد داده کاوی مانند رگرسیون، رده‌بندی، خوشه‌بندی، کاوش قواعد انجمنی و انتخاب ویژگی میباشد. با در نظر گرفتن اینکه، داده‌ها بخش مکمل کار هستند، بسیاری از ابزارهای پیش پردازش داده‌ها و مصورسازی آنها فراهم گشته است. همه الگوریتم ها، ورودیهای خود را به صورت یک جدول رابطهای به فرمت ARFF دریافت میکنند. این فرمت داده‌ها، میتواند از یک فایل خوانده شده یا به وسیله یک درخواست از پایگاه دادهای تولید گردد.

یکی از راههای به کارگیری Weka ، اعمال یک روش یادگیری به یک مجموعه داده و تحلیل خروجی آن برای شناخت چیزهای بیشتری راجع به آن اطلاعات میباشد. راه دیگر استفاده از مدل یادگیری شده برای تولید پیشبینی‌هایی در مورد نمونه‌های جدید است. سومین راه، اعمال یادگیرنده‌های مختلف و مقایسه کارآیی آنها به منظور انتخاب یکی از آنها برای تخمین میباشد. روشهای یادگیری Classifier نامیده میشوند و در واسط تعاملی Weka ، میتوان هر یک از آنها را از منو انتخاب نمود. بسیاری از classifier ها پارامترهای قابل تنظیم دارند که میتوان از طریق صفحه ویژگی‌ها یا object editor به آنها دسترسی داشت. یک واحد ارزیابی مشترک، برای اندازه‌گیری کارآیی همه classifier به کار میرود.

پیاده سازیهای چارچوبهای یادگیری واقعی، منابع بسیار ارزشمندی هستند که Weka فراهم می کند. ابزارهایی که برای پیش پردازش داده‌ها استفاده میشوند Filter نامیده میشوند. همانند classifier ها، میتوان filter ها را از منوی مربوطه انتخاب کرده و آنها را با نیازمندیهای خود، سازگار نمود. در ادامه، به روش به کارگیری فیلترها اشاره میشود.

  علاوه بر موارد فوق، Weka شامل پیاده سازی الگوریتمهایی برای یادگیری قواعد انجمنی، خوشه‌بندی داده‌ها در جایی که هیچ دست‌های تعریف نشده است، و انتخاب ویژگیهای مرتبط در داده‌ها میباشد.

 

 

2- روش استفاده از Weka

جهت درک بهتر مطالب این بخش، یک پایگاه داده با فرمت (comma-separated format ) .csv به نام bank-data.csv به عنوان مثال در نظر گرفته میشود. این بانک اطلاعاتی شامل اطلاعاتی در مورد 600 فرد مختلف است که فیلدهای تشکیل دهنده آن به شرح زیر هستند:

3- واسط های Weka

شکل 1،راههای انتخاب واسط‌های مختلف Weka را نشان میدهد. آسانترین راه استفاده از Weka از طریق واسطی گرافیکی است که Explorer خوانده میشود. این واسط گرافیکی، به وسیله انتخاب منوها و پر کردن فرمهای مربوطه، دسترسی به همه امکانات را فراهم کرده است. برای مثال، میتوان به سرعت یک مجموعه داده را از یک فایل ARFF خواند و درخت تصمیم‌گیری آن را تولید نمود. اما درختهای تصمیم‌گیری یادگیرنده صرفاً ابتدای کار هستند. الگوریتمهای بسیار دیگری برای جستجو وجود دارند. واسط Explorer کمک میکند تا الگوریتمهای دیگر نیز آزمایش شوند.

 

شکل 1. Weka در وضعیت انتخاب واسط

این واسط با در اختیار گذاشتن گزینه‌ها به صورت منو، با وادار کردن کاربر به اجرای کارها با ترتیب صحیح، به وسیله خاکستری نمودن گزینه‌ها تا زمان صحیح به کارگیری آنها، و با در اختیار گذاشتن گزینه‌هایی به صورت فرمهای پرشدنی، کاربر را هدایت میکند. راهنمای ابزار مفیدی، حین عبور ماوس از روی گزینه‌ها، ظاهر شده و اعمال لازم مربوطه را شرح میدهد. پیشفرض‌های معقول قرار داده شده، کاربر را قادر میسازند تا با کمترین تلاشی، به نتیجه برسد. اما کاربر باید برای درک معنی نتایج حاصله، راجع به کارهایی که انجام میدهد، بیندیشد.

 Wekaدو واسط گرافیکی دیگر نیز دارد. واسط knowledge flow به کاربر امکان میدهد تا چنیش‌هایی برای پردازش داده‌های در جریان، طراحی کند. یک عیب پایهای Explorer نگهداری هر چیزی در حافظه اصلی آن است. (زمانی که یک مجموعه داده را باز میکنیم، Explorer ، کل آن را، در حافظ باز میکند) نشان میدهد که Explorer ، صرفاً برای مسایل با اندازه‌های کوچک تا متوسط، قابل اعمال است. با وجود بر این Weka شامل تعدادی الگوریتمهای افزایشی است که میتواند برای پردازش مجموعه های داده بسیار بزرگ مورد استفاده قرار گیرد. واسط knowledge flow امکان میدهد تا جعبه‌های نمایانگر الگوریتمهای یادگیری و منابع داده‌ها را به درون صفحه بکشیم و با اتصال آنها به یکدیگر، ترکیب و چینش دلخواه خود را بسازیم. این واسط اجازه میدهد تا جریان دادهای از مؤلفه‌های به هم متصل که بیانگر منابع داده، ابزارهای پیش پردازش، روشهای ارزیابی و واحدهای مصوّر سازی هستند تعریف شود. اگر فیلترها و الگوریتمهای یادگیری، قابلیت یادگیری افزایشی را داشته باشند، داده‌ها به صورت افزایشی بار شده و پردازش خواهند شد.

  سومین واسط Weka ، که Experimenter خوانده میشود، کمک میکند تا به این سؤال عملی و پایهای کاربر حین استفاده از تکنیکهای رده‌بندی و رگرسیون، پاسخ دهد: «چه روشها و پارامترهایی برای مسأله داده شده، بهتر عمل میکنند؟ »

  عموماً راهی برای پاسخگویی مقدماتی به این سؤال وجود ندارد و یکی از دلایل توسعهWeka ، فراهم نمودن محیطی است که کاربران Weka را قادر به مقایسه تکنیکهای گوناگون یادگیری بنماید. این کار، میتواند به صورت تعاملی در Explorer انجام شود. با این وجود، Experimenter با ساده کردن اجرای رده‌بندی کننده‌ها و فیلترها با پارامترهای گوناگون روی تعدادی از مجموعه‌های داده، جمع‌آوری آمار کارآیی و انجام آزمایـشهای معنا، پردازش را خودکار میکند. کـاربرهای پیشرفته، میتوانند از Experimenter برای توزیع بار محاسباتی بین چندین ماشین، استفاده کنند. در این روش، میتوان آزمایشهای آماری بزرگی را راه‌اندازی نموده و آنها را برای اجرا، رها نمود.

  ورای این واسطهای تعاملی، عملکرد پایهای Weka قرار دارد. توابع پایهای Weka ، از طریق خط فرمانهای متنی قابل دسترسی هستند. زمانی که Weka ، فعال میشود، امکان انتخاب بین چهار واسط کاربری وجود داردExplorer ، knowledge ،Experimenter و واسط خط فرمان. اکثر کاربران، حداقل در ابتدای کار Explorer را به عنوان واسط کاربری انتخاب میکنند.

 

3-1 واسط Explorer

واسط گرافیکی اصلی برای کاربران، Explorer است که امکان دسترسی به همه امکانات Weka را از طریق انتخاب منوها و پر کردن فرمها فراهم میآورد. شکل 2،نمای Explorer را نشان میدهد. در این واسط، شش پانل مختلف وجود دارد که از طریق نوار بالای صفحه قابل انتخاب هستند و با وظایف داده کاوی پشتیبانی شده توسط Weka متناظر میباشند.

شکل 2. واسط گرافیکیExplorer

به طور خلاصه، کارکرد تمام گزینه ها به شرح ذیل است

  • Preprocess: انتخاب مجموعه داده و اصلاح آن از راههای گوناگون
  •  Classify: آموزش برنامه‌های یادگیری که رده‌بندی یا رگرسیون انجام میدهند و ارزیابی آنها
  •  Cluster: یادگیری خوشه‌ها برای مجموعه های داده
  •  Associate: یادگیری قواعد انجمنی برای داده‌ها و ارزیابی آنها
  •  Select attributes: انتخاب مرتبط‌ترین جنبه ها در مجموعه های داده
  •  Visualize: مشاهده نمودارهای مختلف دوبعدی داده‌ها و تعامل با آنها

در بخشهای بعدی به تشریح گزینه‌های مذکور و بیان جزئیات کار با هرکدام خواهم پرداخت.

Weka Explorer امکان رده بندی دارد، چنانچه به کاربران اجازه میدهد به صورت تعاملی اقدام به ساخت درخت تصمیم‌گیری کنند. Wekaنمودار پراکندگی داده‌ها را نسبت به دو ویژگی انتخاب شده، فراهم میآورد. وقتی زوج ویژگی‌ای که رده‌ها را به خوبی جدا میکند، پیدا شد، امکان ایجاد دو شاخه با کشیدن چند ضلعی اطراف نقاط داده‌ها بر نمودار پراکندگی وجود دارد.

هر نوار، دسترسی به دامنه کاملی از امکانات را فراهم میکند. در پایین هر پانل، جعبه status و دکمه log قرار دارد. جعبه status پیغامهایی است که نشان میدهد چه عملیاتی در حال انجام داده شدن است. مثلاً اگر Explores مشغول خواندن یک فایل باشد، جعبه status آن را گزارش میدهد. کلیک راست در هر جا داخل این جعبه یک منو کوچک با دو گزینه میآورد، نمایش میزان حافظه در دسترس Weka و اجرای Java garbage collector .

لازم است توجه شود که garbage collector به طور ثابت به عنوان یک عمل پیش زمینه در هر حال اجرا میشود کلیک دکمه log ، گزارش عملکرد متنی کارهایی که Weka تاکنون در این بخش انجام داده است با برچسب زمانی ارایه میکند.

زمانیکه Weka در حال عملیات است، پرنده کوچکی که در پایین سمت راست پنجره است، بالا و پایین میپرد. عدد پشت × نشان میدهد که به طور همزمان چند عملیات در حال انجام است. اگر پرنده بایستد در حالیکه حرکت نمیکند، او مریض است! اشتباه رخ داده است و باید Explorer از نو اجرا شود.

 

3-1-1 Preprocess

الف- خواندن و فیلتر کردن فایلها

  در بالای پانل Preprocess در شکل 2، دکمه‌هایی برای باز کردن فایل، URL ها و پایگاه های داده وجود دارد. با کلیک بر روی دکمه open File، در ابتدا تنها فایلهای با پسوند arff در browser فایل نمایش داده میشود. برای دیدن سایر فایلها یاید گزینه Format در جعبه انتخاب فایل تغییر داده شود.

شکل 3. باز کردن فایل

در بخشهای بعدی به تشریح گزینه‌های مذکور و بیان جزئیات کار با هرکدام خواهم پرداخت.

Weka Explorer امکان رده بندی دارد، چنانچه به کاربران اجازه میدهد به صورت تعاملی اقدام به ساخت درخت تصمیم‌گیری کنند. Wekaنمودار پراکندگی داده‌ها را نسبت به دو ویژگی انتخاب شده، فراهم میآورد. وقتی زوج ویژگی‌ای که رده‌ها را به خوبی جدا میکند، پیدا شد، امکان ایجاد دو شاخه با کشیدن چند ضلعی اطراف نقاط داده‌ها بر نمودار پراکندگی وجود دارد.

هر نوار، دسترسی به دامنه کاملی از امکانات را فراهم میکند. در پایین هر پانل، جعبه status و دکمه log قرار دارد. جعبه status پیغامهایی است که نشان میدهد چه عملیاتی در حال انجام داده شدن است. مثلاً اگر Explores مشغول خواندن یک فایل باشد، جعبه status آن را گزارش میدهد. کلیک راست در هر جا داخل این جعبه یک منو کوچک با دو گزینه میآورد، نمایش میزان حافظه در دسترس Weka و اجرای Java garbage collector .

لازم است توجه شود که garbage collector به طور ثابت به عنوان یک عمل پیش زمینه در هر حال اجرا میشود کلیک دکمه log ، گزارش عملکرد متنی کارهایی که Weka تاکنون در این بخش انجام داده است با برچسب زمانی ارایه میکند.

زمانیکه Weka در حال عملیات است، پرنده کوچکی که در پایین سمت راست پنجره است، بالا و پایین میپرد. عدد پشت × نشان میدهد که به طور همزمان چند عملیات در حال انجام است. اگر پرنده بایستد در حالیکه حرکت نمیکند، او مریض است! اشتباه رخ داده است و باید Explorer از نو اجرا شود.

 

3-1-1 Preprocess

الف- خواندن و فیلتر کردن فایلها

  در بالای پانل Preprocess در شکل 2، دکمه‌هایی برای باز کردن فایل، URL ها و پایگاه های داده وجود دارد. با کلیک بر روی دکمه open File، در ابتدا تنها فایلهای با پسوند arff در browser فایل نمایش داده میشود. برای دیدن سایر فایلها یاید گزینه Format در جعبه انتخاب فایل تغییر داده شود.

شکل 3. باز کردن فایل

 

ب- تبدیل فایلها به فرمت ARFF

نرم افزار Weka دارای سه مبدل فرمت فایل میباشد، برای فایلهای صفحه گسترده با پسوند CSV ، فرمت فایل C4.5 با پسوند .namesو data و برای نمونه های سری با پسوند.bsi .

اگر Weka قادر به خواندن داده ها نباشد، سعی میکند آن را به صورت ARFF تفسیر کند. اگر نتواند پیغام نشان داده شده در شکل 4 (الف) ظاهر میشود. با انتخاب گزینه Use Convertor، پیغام شکل 4 (ب) ظاهر میشود

شکل4 (الف) پیغام خطا

 

شکل4 (ب) ویرایشگر

  این، یک ویرایشگر عمومی اشیاء است که در Weka برای انتخاب و تنظیم اشیا بکار میرود. به عنوان مثال وقتی پارامتری برای Classifier تنظیم میشود، جعبه ای با نوع مشابه بکار برده میشود. CSV Loader برای فایلهای با پسوند .CSVبه طور پیش فرض انتخاب میشود. دکمه More اطلاعات بیشتری در مورد آن میدهد که در شکل 4 (ج) نشان داده شده است.

همیشه مطالعه مستندات ارزشمنداست، در این حالت نشان میدهد که ردیف نخست صفحه گسترده، نام ویژگی را تعیین میکند. برای استفاده از این مبدل باید بر Ok کلیک شود. برای مورد مختلف لازم است بر choose کلیک شود تا از لیست شکل 4 (د) انتخاب انجام شود.

  گزینه اول، Arffloader است و فقط به دلیل ناموفق بودن به این نقطه میرسیم.CSVLoader پیش فرض است و در صورت نیاز به فرض دیگر، choose کلیک میشود. دومین گزینه، مربوط به فرمت C4.5 است که دو فایل برای مجموعه داده وجود دارد یکی اسمها و دیگـری داده های واقعـی میباشد. چهارمین برای نمونه های سریالی، برای بازخوانی مجموعه داد‌ه‌ای است که به صورت شیئ سریالی شده جاوا ذخیره شده است. هر شیء در جاوا میتواند در این شکل ذخیره و بازخوانی شود. به عنوان یک فرمت بومی جاوا، سریعتر از فایل ARFF خوانده میشود چرا که فایل ARFF باید تجزیه و کنترل شود. وقتی یک مجموعه داده بزرگ مکررا بازخوانی میشود، ذخیره آن در این شکل سودمند است.

  ویژگیهای دیگر ویرایشگر عمومی اشیا در شکل 4 (ب)، save و open است که به ترتیب برای ذخیره اشیای تنظیم شده و بازکردن شیئی که پیش از این ذخیره شده است، به کار میرود. اینها برای این نوع خاص شیئ مفید نیستند. لکن پانلهای دیگر ویرایشگر عمومی اشیاء، خواص قابل ویرایش زیادی دارند. به دلیل مشکلاتی که ممکن است حین تنظیم مجدد آنها رخ دهد، میتوان ترکیب اشیاء ایجاد شده را برای استفاده‌های بعدی، ذخیره کرد.

  تنها منبع مجموعه‌های داده برایWeka ، فایلهای موجود روی کامپیوتر نیستند. میتوان یک URL را باز کرد تا Weka از پروتکل HTTP برای دانلود کردن یک فایل Arff از شبکه استفاده کند. همچنین میتوان یک پایگاه داده‌ها را باز نمود ( open DB ـ هر پایگاه دادهای که درایور اتصال به مجموعه های داده به زبان جاوا JDBC را دارد.) و به وسیله دستور select زبان SQL ، نمونه‌ها را بازیابی نمود. داده‌ها میتوانند به کمک دگمه save به همه فرمتهای ذکر شده، ذخیره شوند. جدای از بحث بارگذاری و ذخیره مجموعه‌های داده، پانل preprocess به کاربر اجازه فیلتر کردن داده‌ها را میدهد. فیلترها، اجزای مهم Weka هستند.

بعد از اینکه فایل بارگذاری شد، Weka فیلدها را تشخیص میدهد و حین بررسی آنها، اطلاعات آماری پایهای را برای هر کدام از صفات محاسبه میکند. همان طور که در شکل 5 نشان داده شده است، لیست صفات تشخیص داده شده، در سمت چپ، پایین و اطلاعات پایگاه داده مربوطه در بالای آن نشان داده میشود.

 

شکل5. بانک اطلاعاتیbank-data.csv

با کلیک برروی هر کدام از صفات، میتوان اطلاعات آماری اصلی آن را در سمت راست مشاهده نمود. به عنوان مثال شکل 6 از انتخاب فیلد age نتیجه شده است.

نمودار ترسیم شده در سمت راست، پایین، بر اساس دو فیلد است. فیلد دوم به صورت پیشفرض، آخرین فیلد در پایگاه داده است که میتوان آن را به دلخواه تغییر داد.

 

شکل6. اطلاعات آماری فیلد age

 

ج- به کارگیری فیلترها

با کلیک دگمهchoose (گوشه بالا و سمت چپ) در شکل 3 میتوان به لیستی از فیلترها دست یافت. میتوان از فیلترها برای حذف ویژگیهای مورد نظر از یک مجموعه داده و یا انتخاب دستی ویژگیها استفاده نمود. مشابه این نتیجه را میتوان به کمک انتخاب ویژگیهای مورد نظر با تیک زدن آنها و فشار دادن کلیه Remove به دست آورد.

شکل 7 مراحل لازم برای حذف فیلد id از بانک اطلاعاتی، با استفاده از روش اول را نشان میدهد.

 

شکل 6 (الف). انتخاب فیلتر Remove

 

 

شکل 6 (ب). وارد کردن شماره فیلد مورد نظر

 

شکل 6 (ج).انتخاب گزینه Apply و حذف فیلد id

یکی دیگر ازفیلترهای موجود، Discretize است که با استفاده از آن میتوان مقادیریک صفت پیوسته را به تعداد دلخواه بازه گسسته تبدیل کرد. شکل7 مراحل لازم برای شکستن مقادیر صفت age به 3 بازه را نشان میدهد.

 

شکل7 (الف). انتخاب فیلتر Discretize

 

شکل7 (ب). وارد کردن شماره فیلد مورد نظر و انجام تنظیمات

 

شکل 7 (ج).انتخاب گزینه Apply

3-1-2 Classify

الف- الگوریتمهای رده‌بندی

Weka الگوریتمهای classification و prediction بسیار متنوعی را پیاده‌سازی میکند. الگوریتمهای رده‌بندی، به رده‌بندهای Bayesian، functions،lazy ،meta ، misc، trees و rules تقسیم شده‌اند. جدول شکل 8، لیست اسامی رده بندهای Weka را نمایش میدهد.

 

  شکل 8 (الف). الگوریتمهای رده بندی در Weka

 

شکل 8 (ب). الگوریتمهای رده بندی در Weka

دراین قسمت برخی از اسامی رده‌بندیهای Weka معرفی میشوند.

  •  Trees

ü Decision stumpکه برای استفاده توسط روشهای boosting طراحی شده است، برای مجموعه‌های داده عددی یا رده‌ای، درخت تصمیم‌گیری یک سطحی میسازد. این الگوریتم، با مقادیر از دست رفته، به صورت مقادیر مجزا برخورد کرده و شاخه سومی از درخت توسعه میدهد

  •  Rules
    • ü Decision Tableیک رده‌بندی بر اساس اکثریت جدول تصمیم‌گیری میسازد. این الگوریتم، با استفاده از جستجوی اولین بهترین، زیر دسته‌های ویژگیها را ارزیابی میکند و میتواند از اعتبارسنجی تقاطعی برای ارزیابی بهره برد. (Kohavi 1995 )
    • یک امکان این است که به جای استفاده از اکثریت جدول تصمیم‌گیری که بر اساس دسته ویژگیهای مشابه عمل میکند، از روش نزدیکترین همسایه برای تعیین رده هر یک از نمونه‌ها که توسط مدخل (Entry) جدول تصمیمگیری پوشش داده نشده‌اند، استفاده شود.
    • ü   Conjunctive Ruleقاعده‌ای را یاد میگیرد که مقادیر رده‌های عددی را پیشبینی میکند. نمونه‌های آزمایشی به مقادیر پیش فرض رده نمونه‌های آموزشی، منسوب میشوند. سپس تقویت اطلاعات (برای ردههای رسمی)، یا کاهش واریانس (برای ردههای عددی) مربوط به هر والد محاسبه شده و به روش هرس کردن با خطای کاهش یافته (Reduced-error pruning) ، قواعد هرس میشوند.
    • ü  ZeroRبرای رده‌های اسمی، اکثریت داده‌های مورد آزمایش و برای رده‌های عددی، میانگین آنها را پیشبینی میکند. این الگوریتم بسیار ساده است.
    • ü M5Rulesبه کمک M5 از روی درختهای مدل، قواعد رگرسیون استخراج میکند.
    •  
    • در این بخش به شرح مختصری برخی از این الگوریتم‌ها و پارامترهایشان که قابلیت کار با ویژگی های عددی را دارند، پرداخته میشود. 
  •  Functions
    • ü   Simple Linear Regressionمدل رگرسیون خطی یک ویژگی مشخص را یاد میگیرد، آنگاه مدل با کمترین خطای مربعات را انتخاب میکند. در این الگوریتم، مقادیر از دست رفته و مقادیر غیرعددی مجاز نیستند.
    • ü Linear Regressionرگرسیون خطی استاندارد با کمترین خطای مربعات را انجام میدهد و میتواند به طور اختیاری به انتخاب ویژگی بپردازد، این کار میتواند به صورت حریصانه، با حذف عقب رونده (Backward elimination) انجام شود، یا با ساختن یک مدل کامل از همه ویژگیها و حذف یکی یکی جمله‌ها با ترتیب نزولی ضرایب استاندارد شده آنها، تا رسیدن به شرط توقف مطلوب انجام گیرد.
    • ü   Least Med sq یک روش رگرسیون خطی مقاوم است که به جای میانگین مربعات انحراف از خط رگرسیون، میانه را کمینه میکند. این روش به طور مکرر رگرسیون خطی استاندارد را به زیرمجموعه‌هایی از نمونه‌ها اعمال میکند و نتایجی را بیرون میدهد که کمترین خطای مربع میانه را دارند.
    • ü   SMOreg الگوریتم بهینه سازی حداقل ترتیبی را روی مسایل رگرسیون اعمال میکند.
    • ü   Pace Regression ، با استفاده از تکنیک رگرسیون pace ، مدلهای رگرسیون خطی تولید میکند. رگرسیونpace ، زمانی که تعداد ویژگیها خیلی زیاد است، به طور ویژهای در تعیین ویژگیهایی که باید صرفنظر شوند، خوب عمل میکند. در واقع در صورت وجود نظم و ترتیب خاصی، ثابت میشود که با بینهایت شدن تعداد ویژگیها، این الگوریتم بهـینه عمل میکند.
    • ü RBF Network یک شبکه با تابع پایهای گوسی شعاعی را پیاده سازی میکند. مراکز و عرضهای واحدهای مخفی به وسیله روش میانگین (K-means)K تعیین میشود. سپس خروجیهای فراهم شده از لایه‌های مخفی (Hidden layer) ، با استفاده از رگرسیون منطقی در مورد رده‌های اسمی و رگرسیون خطی در مورد رده‌های عددی، با یکدیگر ترکیب میشوند. فعال سازیهای توابع پایه پیش از ورود به مدلهای خطی، با جمع شدن با عدد یک، نرمالیزه میشوند. در این الگوریتم میتوان K، تعداد خوشه‌ها، بیشترین تعداد تکرارهای رگرسیونهای منطقی برای مسأله‌های رده‌های رسمی، حداقل انحراف معیار خوشه‌ها، و مقدار بیشینه رگرسیون را تعیین نمود. اگر رده‌ها رسمی باشد، میانگین K به طور جداگانه به هر رده اعمال میشود تا K خوشه مورد نظر برای هر رده استخراج گردد.
  •   رده بندهای Lazy

  یادیگرنده‌های lazy نمونه‌های آموزشی را ذخیره میکنند و تا زمان رده بندی هیچ کار واقعی انجام نمیدهند.

  • ü   IB1یک یادگیرنده ابتدایی بر پایه نمونه است که نزدیکترین نمونه‌های آموزشی به نمونه‌های آزمایشی داده شده را از نظر فاصله اقلیدسی پیدا کرده و نزدیکترین رده‌ای مشابه رده همان نمونه‌های آموزشی را تخمین میزند.
  • ü   IBKیک رده بند با K همسایه نزدیک است که معیار فاصله ذکر شده را استفاده میکند. تعداد نزدیکترین فاصله‌ها (پیش فرض k=1 )، میتواند به طور صریح در ویرایشگر شیء تعریف شود. پیشبینی‌های متعلق به پیش از یک همسایه میتواند بر اساس فاصله آنها تا نمونه‌های آزمایشی، وزندار گردد.
  • دو فرمول متفاوت برای تبدیل فاصله به وزن، پیاده سازی شده‌اند. تعداد نمونه‌های آموزشی که به وسیله رده بند نگهداری میشـود، میتواند با تنظـیم گزیـنه اندازه پنجره محدود گردد. زمانی که نـمونه‌های جدید اضافه میشوند، نمونه‌های قدیمی حذف شده تا تعداد کل نمونه‌های آموزشی در اندازه تعیین شده باقی بماند.
  • ü Kstar یک روش نزدیکترین همسایه است که از تابع فاصلهای عمومی شده بر اساس تبدیلات استفاده میکند.
  • ü LWL یک الگوریتم کلی برای یادگیری وزن دار شده به صورت محلی است. این الگوریتم با استفاده از یک روش بر پایه نمونه، وزنها را نسبت میدهد و از روی نمونه‌های وزندار شده، رده‌بند را میسازد. رده‌بند Nave Bayes، در ویرایشگر شیء LWL انتخاب میشود. برای مسایل رده بندی و رگرسیون خطی برای مسایل رگرسیون، انتخابهای خوبی هستند. میتوان در این الگوریتم، تعداد همسایه‌های مورد استفاده را که پهنای باند هسته و شکل هسته مورد استفاده برای وزن دار کردن را (خطی، معکوس، یا گوسی) مشخص میکند، تعیین نمود. نرمال سازی ویژگیها به طور پیش فرض فعال است.

الف- نحوه کار با پانل classify

تا اینجا به صورت تئوری الگوریتمهای رده‌بندی را معرفی کردیم. درادامه با یک مثال عملی نحوه کار با classifier ها را نشان میدهیم.

در این قسمت، بانک اطلاعاتی bank-data-final به عنوان فایل نمونه در نظر گرفته میشود. بعد از باز کردن فایل مورد نظر و با کلیک بر روی پانل classify، پنجرهای مطابق شکل 9 باز میشود.

 

شکل 9 . انتخاب پانل classify

با کلیک دگمه choose در پانل classifyمیتوان الگوریتم رده‌بندی مورد نظر را انتخاب نمود (شکل 10). دراین مثال، الگوریتم J48 را انتخاب میکنیم. زمانی که یک الگوریتم رده‌بندی انتخاب میشود، نسخه خط فرمانی (Command line) رده بند در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل11). در این مثال همان مقادیر پیشفرض را میپذیریم.

 

شکل 10. انتخاب الگوریتم ردهبندی

 

شکل 11. تنظیم پارامترهای الگوریتم رده بندی

باکلیک بر روی دکمه start مدل مورد نظر تولید میشود (شکل12).

 

شکل 12. مدل حاصل از اجرای الگوریتم رده بندی

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ میتوان نتیجه را در پنجرهای جداگانه، و یا شکل گرافیکی درخت حاصل از رده بندی را مشاهده نمود. (شکل 13) توجه کنید که در شکل 13(ب) باراست کلیک برروی یک قسمت خالی ازصفحه میتوان نحوه نمایش درخت را به دلخواه تنظیم کرد.

 

شکل 13(الف)

 

شکل 13(ب). درخت حاصل از رده بندی

3-1-3 Cluster

فایل نمونه مورد استفاده در این قسمت bank-data.csv است که در مرحله preprocess فیلد id را از آن حذف میکنیم (شکل14).

 

شکل 14. بارگذاری فایل نمونه

میشود. بعد از باز کردن فایل مورد نظر و با کلیک بر روی پانل cluster پنجرهای مطابق شکل 15 باز میشود.

 

شکل 15 . انتخاب پانل cluster

Weka الگوریتمهای خوشه‌بندی (clustering) متنوعی را پیاده‌سازی میکند. با کلیک دگمه choose در پانل cluster میتوان الگوریتم خوشه‌بندی مورد نظر را انتخاب نمود (شکل 16). دراین مثال، الگوریتم SimpleKMeans را انتخاب میکنیم. زمانی که یک الگوریتم خوشه‌بندی انتخاب میشود، نسخه خط فرمانی الگوریتم خوشه‌بندی در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل17). در این مثال تعداد کلاسترها را 6 تا تنظیم میکنیم.

 

شکل 16. انتخاب الگوریتم خوشه‌بندی

 

شکل 17. تنظیم پارامترهای الگوریتم خوشه‌بندی

باکلیک بر روی دکمه start مدل مورد نظر تولید میشود (شکل18).

 

شکل 18. مدل حاصل از اجرای الگوریتم خوشه‌بندی

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ-پایین و انتخاب گزینه‌ی "View in separate window "میتوان نتیجه را در پنجرهای جداگانه مشاهده نمود (شکل 19). همانطور که میبینید، اطلاعات آماری مربوط به هرکلاستر، از جمله مرکز ثقل هر کلاستر، تعداد و درصد اعضای هر کلاستردر این پنجره قابل مشاهده است.

 

شکل 19. نتیجه حاصل از اجرای الگوریتم خوشه‌بندی

روش دیگر برای کسب اطلاعات در مورد هرکلاستر، مصورسازی است. با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ و انتخاب گزینهی " Visualize cluster assignments" پنجرهای مطابق شکل20(الف) باز میشود. انتخابهای مختلف برای هرکدام از سه بعد نمودارحاصل (محور X، محور Y، رنگ) نمودارهای مختلفی را نتیجه میدهد که میتوان از آنها اطلاعات مورد نظر را بدست آورد.به عنوان مثال در شکل20(ب)، محور Xها نماینده شماره کلاستر، محور Yها نماینده شماره نمونه در بانک اطلاعاتی، و رنگها نماینده جنسیت هستند (قرمز: مرد، آبی: زن). همانطورکه مشاهده میشود کلاستر2 بیشتر توسط زنان احاطه شده است و کلاستر4 توسط مردان.

 

شکل20 (الف)

شکل20 (ب) مصورسازی نتیجه حاصل از clustering

علاوه بر این ممکن است علاقه‌مند باشیم که بدانیم هر نمونه در بانک اطلاعاتی، به کدام کلاستر اختصاص داده شده است. برای این منظور در پنجره شکل 20(ب)، گزینه save را انتخاب میکنیم و فایل مورد نظر را با نام " bank-data-Kmeans" ذخیره میکنیم. فایل حاصل رامیتوان از طریق یک نرم‌افزار پردازش متن مثل Notepad یا word باز کرد. بخش ابتدایی این فایل در شکل21 نشان داده شده است. همانطورکه مشـاهده میکنید، Weka ویژگی جدیدی به نام Cluster را به مجموعه ویژگیهای موجود اضافه کرده است.

 

شکل21. نتیجه اختصاص نمونه‌ها به کلاسترها

3-1-4 Associate

در این قسمت میتوان قوانین Association حاکم بربانک اطلاعاتی را با استفاده از الگوریتم‌های مختلف بدست آورد.

فایل نمونه مورد استفاده در این بخش bank-data-final.arff است که در مرحله preprocess فیلد id از آن حذف شده و مقادیرصفات age و income به صورت گسسته در آمده است (شکل22).

 

شکل 22. بارگذاری فایل نمونه

بعد از باز کردن فایل مورد نظر و با کلیـک بر روی پانل Associate پنجره‌ای مطـابق شکـل23 باز میشود.

شکل 23 . انتخاب پانل Associate

 

Weka الگوریتمهای association متفاوتی را پیاده‌سازی میکند. با کلیک دگمه choose در پانل Associate میتوان الگوریتم association مورد نظر را انتخاب نمود (شکل 24). دراین مثال، الگوریتم Apriori را انتخاب میکنیم. زمانی که یک الگوریتم انتخاب میشود، نسخه خط فرمانی آن الگوریتم در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل25). در این مثال همان پارامترهای پیشفرض را میپذیریم.

شکل 24. انتخاب الگوریتم association

 

شکل 25. تنظیم پارامترهای الگوریتم association

با کلیک بر روی گزینه More در شکل25، میتوان توضیحات لازم را درمورد هر کدام از پارامترها بدست آورد. شکل26 این توضیحات را نشان میدهد.

 

شکل 26. توضیحات بیشتردر مورد پارامترهای الگوریتم Apriori

بعد از تنظیم پارامترهای مورد نظر، با کلیک بر روی گزینه start، قوانین بدست آمده که بر اساس metric Type مرتب شده‌اند در صفحه اصلی نمایش داده میشوند.(شکل27)

شکل 27. نتیجه اجرای الگوریتم Apriori

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ و انتخاب گزینه‌ی مورد نظر، میتوان نتایج بدست آمده را در پنجره‌ای جداگانه نمایش داد و یا قوانین بدست آمده را به فرمت دلخواه (.csv, .arff, .txt) ذخیره کرد. شکل28 گزینه‌های موجود را نشان میدهد.

 

 

 

شکل 28. ذخیره قوانین بدست آمده



:: موضوعات مرتبط: نرم افزا وکا , ,
:: بازدید از این مطلب : 322
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 27 شهريور 1395 | نظرات ()

صفحه قبل 1 2 3 4 صفحه بعد